بهسازی گفتار با استفاده از ویونت
thesis
- وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده برق
- author سمیرا مغانی
- adviser حسین مروی
- publication year 1391
abstract
بهسازی گفتار یا speech enhancement بیانگر گروه بزرگی از روش هاست که با انجام پردازش هایی روی سیگنال های نویزی، نهایتا منجر به بهبود کیفیت و قابلیت فهم گفتار می شود. تاکنون چندین روش در زمینه بهسازی گفتار نویزی ارائه شده است. روش پیشنهادی ما در این پایان نامه، شبکه عصبی موجک (ویونت) می باشد. این روش، مدلی مبتنی بر تلفیق شبکه عصبی با تبدیل موجک می باشد و به عنوان جایگزین مناسب در شبکه های عصبی پسخورد جهت تخمین و تقریب توابع غیرخطی اختیاری پیشنهاد می شود. در شبکه استاندارد پسخورد تابع فعال سازی نرون لایه پنهان یک تابع سیگموئید است. حال آنکه شبکه های عصبی موجک توابع موجک را به عنوان توابع فعالسازی نرون های لایه پنهان از شبکه پسخور مورد استفاده قرار میدهند. در روش پیشنهادی دو حالت برای دسترسی به نویز در نظر گرفته شد. حالت الف، حالتی است که دسترسی مستقیم به نویز محیط وجود دارد و حالت ب، حالتی است که از تخمین نویز استفاده کرده ایم. روش پیشنهادی برای تخمین نویز، استفاده از تبدیل موجک می باشد. موجک استفاده شده در این مرحله دابیشز 5 (db5) می باشد. روش پیشنهادی برای دادگان فارسی پیاده سازی شده است و برای ارزیابی و عملکرد آن از سه معیار سیگنال به نویز، سیگنال به نویز قطعه ای وlog likellihood ratio (llr) استفاده شده است. در نهایت روش پیشنهادی با شبکه عصبی و ترکیب شبکه عصبی با موجک و روش موجک مقایسه شده است. بررسی نتایج و آزمایشات نشان دهنده عملکرد قابل قبول روش پیشنهادی است.
similar resources
بهسازی گفتار با استفاده از گذرای سیگنال
در دهه های گذشته تحقیقات گسترده ای برای بهبود فهم گفتار نویزی انجام شده است. این تحقیقات می تواند به 2 گروه تقسیم شود :روش های کاهش نویز و بهبود گفتار یا مقاوم سازی گفتار. گروه اول شامل تکنیک هایی است که نویز ترکیب شده با گفتار را با کمترین تاثیر روی فهم گفتار کاهش می دهد. این روش ها در شرایطی که ماهیت نویز نامعلوم باشد به خوبی کار نمی کنند. این گروه از روش های بهسازی سیگنال گفتار، روش کاهش نوی...
15 صفحه اولبهسازی گفتار تککاناله با استفاده از ترکیب مدل قطعی نمایی و مدل تصادفی t Location-Scale
بیشتر روشهای بهسازی گفتار، تخمینگری کاملاً متکی به مدل تصادفی گفتار ارائه میدهند. در این مقاله، یک تخمینگر کمترین میانگین مربعات خطا تحت یک مدل قطعی - تصادفی پیشنهاد میشود که در آن از یک توزیع دنباله - سنگین به نام(tls) t location-scale برای مدلکردن ضرایب تبدیل فوریه گسسته گفتار تمیز و از مدل نمایی و سینوسی بهعنوان مدل قطعی استفاده شده است. در مدل نمایی بهکاررفته، تخمین ...
full textبهسازی گفتار با استفاده سیستمهای gsc
نویز و انعکاس مهمترین عوامل محیطی موثر در تخریب سیگنال گفتار محسوب می شوند. هدف از این تحقیق بررسی یکی از پرکاربردترین ساختارهای بهسازی گفتار با نام حذف کننده لوب های فرعی (gsc) در مقابله با نویزهای جهت دار محیط است.به دنبال کاربردهای زیاد ساختار gsc برای حذف نویزهای جهت دار در حوزه سیگنال های باندباریک (همچون رادار، سونار و ...)، استفاده از این ساختار با هدف مقابله با نویزهای باندوسیع موجود بر...
بهسازی گفتار با تخمین گر کمترین میانگین مربعات خطا برپایه توزیع مخلوط لاپلاس برای گفتار
In this paper an estimator of speech spectrum for speech enhancement based on Laplacian Mixture Model has been proposed. We present an analytical solution for estimating the complex DFT coefficients with the MMSE estimator when the clean speech DFT coefficients are mixture of Laplacians distributed. The distribution of the DFT coefficients of noise are assumed zero-mean Gaussian.The drived MMSE...
full textبهسازی وفقی سیگنال گفتار در محیطهای واقعی با استفاده از ساختار ترکیبی مبتنی بر شکلدهندههای پرتو و فیلتر پسینه
تنوع میدانهای نویزی حاکم بر محیطهای واقعی، طراحی سیستم واحدی را که قادر به حذف کامل همه اغتشاشات محیطی باشد، با مشکل مواجه میکند. لذا، داشتن یک شناخت اولیه از میدانهای نویزی موجود در محیط و بررسی نوع اثر هر یک بر روی سیگنال گفتار، گام مؤثری در جهت فرآیند بهسازی محسوب میشود. در این مقاله، ضمن بررسی نویزهای اساسی موجود در زمینه گفتار ضبطشده در شرایط واقعی، به ارزیابی میدانهای نویزی پایینگ...
full textبهسازی گفتار با تخمین گر کمترین میانگین مربعات خطا برپایه توزیع مخلوط لاپلاس برای گفتار
در این مقاله یک روش بهسازی گفتار آماری با فرض توزیع مخلوط لاپلاس برای گفتار، برای تخمین سیگنال گفتار تمیز (بدون نویز) از سیگنال گفتار نویزی ارائه شده است. در روش پیشنهادی، ضرایب تبدیل فوریه زمان کوتاه گسسته سیگنال گفتار با استفاده از تخمین گر کمترین میانگین مربعات خطا، بدست می آید. در این تخمین، فرض می شود که تابع چگالی احتمال ضرایب تبدیل فوریه سیگنال تمیز و نویز به ترتیب، مخلوط لاپلاس و گوسی ب...
full textMy Resources
document type: thesis
وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی شاهرود - دانشکده برق
Keywords
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023